AI资讯新闻榜单内容搜索- DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  DeepSeek
国产大模型杀疯了,MiniMax-M2.5即将开源!

国产大模型杀疯了,MiniMax-M2.5即将开源!

国产大模型杀疯了,MiniMax-M2.5即将开源!

这两天 AI 圈真的太热闹了,就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时,MiniMax 率先冲锋,更新了他们的新旗舰模型:MiniMax-M2.5。更有意思的是,国外网友这段时间对国内 AI 大模型的更新节奏格外关注,他们甚至把这种争先更新的现象称为:Happy Chinese new year!

来自主题: AI资讯
9710 点击    2026-02-12 18:07
决定了:过年攻略全都不过脑子,让AI去想

决定了:过年攻略全都不过脑子,让AI去想

决定了:过年攻略全都不过脑子,让AI去想

春节还没到,「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块,刚刚发布的有 kimi 2.5 和 Step 3.5 Flash,即将发布的据说还有 DeepSeek V4,GPT-5.3、Claude Sonnet 5、Qwen 3.5,GLM-5,说不定一觉醒来,现有的技术就要被颠覆。

来自主题: AI技术研报
5495 点击    2026-02-12 15:32
领英、猎聘们「抓」不到的 AI 天才,这个团队想用 AI「追猎」

领英、猎聘们「抓」不到的 AI 天才,这个团队想用 AI「追猎」

领英、猎聘们「抓」不到的 AI 天才,这个团队想用 AI「追猎」

当 DeepSeek 和 OpenAI 的核心突破者越来越年轻,传统的简历筛选正在失效。一位前阿里达摩院的研究员,试图用 Agent 编织一张能捕捉「下一个 Ilya」的网。

来自主题: AI资讯
8096 点击    2026-01-20 17:23
DeepSeek连发两篇论文背后,原来藏着一场学术接力

DeepSeek连发两篇论文背后,原来藏着一场学术接力

DeepSeek连发两篇论文背后,原来藏着一场学术接力

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

来自主题: AI技术研报
10126 点击    2026-01-16 10:06
刚刚,DeepSeek 再发梁文锋署名新论文:Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models

刚刚,DeepSeek 再发梁文锋署名新论文:Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models

刚刚,DeepSeek 再发梁文锋署名新论文:Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models

今天凌晨,喜欢闷声做大事的 DeepSeek 再次发布重大技术成果,在其 GitHub 官方仓库开源了新论文与模块 Engram,论文题为 “Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models”, 梁文锋再次出现在合著者名单中。

来自主题: AI资讯
10471 点击    2026-01-13 07:59
DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生,太上头了

DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生,太上头了

DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生,太上头了

前几天元旦,DeepSeek 又激发了「假期更新」 Buff,梁文锋署名新论文刷屏 AI 圈,就在大家都在等待 V4 的发布时,我发现有一群人早就在 DeepSeek 里找到了新乐子:自制「橙光游戏」。

来自主题: AI资讯
8663 点击    2026-01-11 10:04
体验英伟达 AI 个人超算「核弹」DGX Spark,能微调出 DeepSeek R2 吗

体验英伟达 AI 个人超算「核弹」DGX Spark,能微调出 DeepSeek R2 吗

体验英伟达 AI 个人超算「核弹」DGX Spark,能微调出 DeepSeek R2 吗

最近,APPSO 终于拿到了这台来自黄仁勋倾情推荐的个人超算,英伟达 DGX Spark;到手的第一感觉,就是「小而美」。这电脑也太小了,没有 Mac Studio 那般笨重,可能就和 Mac Mini 差不多大;然后是银色的亮和用来散热的金属丝网又让它有点不一样,是专属的硬核美感。

来自主题: AI资讯
7982 点击    2025-12-31 15:19
DeepSeek V3到V3.2的进化之路,一文看全

DeepSeek V3到V3.2的进化之路,一文看全

DeepSeek V3到V3.2的进化之路,一文看全

12 月 1 日,DeepSeek 一口气发布了两款新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去,热度依旧不减,解读其技术报告的博客也正在不断涌现。知名 AI 研究者和博主 Sebastian Raschka 发布这篇深度博客尤其值得一读,其详细梳理了 DeepSeek V3 到 V3.2 的进化历程。

来自主题: AI技术研报
8493 点击    2025-12-08 12:48
NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

大模型推理的爆发,实际源于 scaling 范式的转变:从 train-time scaling 到 test-time scaling(TTS),即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法:通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗?

来自主题: AI技术研报
8103 点击    2025-11-30 09:30